Matrix Derivative
矩阵的导数运算
一、标量方程对向量的导数
分子: 为 的标量;分母: 为 的向量
1. 分母布局 denominator layout
与分母的行数相同
2. 分子布局 numerator layout
与分子的行数相同
以上两种布局没有本质区别,互为转置;为方便起见,以下的推导默认使用分母布局。
二、向量方程对标量的导数
三、向量方程对向量的导数
分母布局的结果如下:(其转置(分子布局)实际上为雅可比矩阵)
有关结论(分母布局)
二次型的求导:
如果 为对称阵,则有
链式法则
标量的链式求导,注意矩阵不满足乘法交换律
使用分母布局:
离散状态空间方程:
代价函数:
实际应用
线性回归
使用矩阵求解
如果没有解析解,使用机器学习的梯度下降
定义初始值
循环迭代
- 梯度:
- 学习率:
注意如果没有归一化处理,学习率的选取要结合未知向量各值的数量级
归一化处理后:各个未知数用同一个学习率,使用标量 即可